Инфрастуктура за Геномни Данни

Genomic Data Infrastructure (GDI)

Светомир Хитов

Център по Молекулна Медицина

2025-12-08

Структура на проекта

Колона I

Подсигуряване на правна рамка и финансиране на съществуването на проекта за в бъдеще

Колона II

Изграждане на ИТ инфраструктура, която да поддържа визията на 1+MG

Колона III

Дефиниране на аналитични сценарии и казуси

Компоненти и услуги

Общ преглед

1+MG функционалности
Data Discovery
Data Access Management
Storage and Interfaces
Data Reception
Data Processing
"потребителско пътешествие"
User Portal:
Data Catalog
AF Browser
User Portal:
Access Management & LS AAI
Sensitive Data Archive
GoE Data
SPE Computation
LS AAI & REMS
ISO & GA4GH стандарти
DUO
Phenopackets
Beacon
FDP
Passports
DUO
AAI
CRYPT4GH
Phenopackets
VCF
SAM/BAM/CRAM
htsget
TES
WES
TRS
DRS

“Потребителско пътешествие”

sequenceDiagram
    box
    participant User
    end
    box rgb(123,28,88) Системи
    participant Data Discovery
    participant Data Access Management
    participant Storage and Data Reception
    participant Data Processing
    end
    User->>Data Discovery: Търсене на набор от данни
    Data Discovery->>User: Списък с колекции от данни
    User->>Data Access Management: Вписване в Life Sciennce AAI
    Data Access Management->>User: Потребителя получава свидетелство за дигитално валидирана самоличност
    User->>Data Access Management: Подаване за заявка за достъп до колекция(и) от данни
    Data Access Management->>User: Потребителя получава достъп или не получава
    User->>Storage and Data Reception: Поискване на данни
    Storage and Data Reception->>User: Доставяне на сурови данни
    User->>Data Processing: Изпращане на задача до центъра за изчисления
    Data Processing->>Storage and Data Reception: Достъпване на необходимите сурови данни
    Storage and Data Reception->>Data Processing: Зареждане на получените данни в работна среда
    Data Processing->>User: Връщане на резултати

Стандарти по ISO и GA4GH

Имплементация в България

Физическа инфраструктура

Физическа инфраструктура

Физическа инфраструктура

Сървърна стая 01 Сървърна стая 02

Логическа инфраструктура

Партньорски организации
Вътрешни потребители
Обратен прокси сървър
Вътрешни системи
Виртуални Машини
Контейнери
Езеро от данни
Физическа инфраструктура

Приложения на GDI

Какво да очакваме от GDI в близко и по-далечно бъдеще.

Стадий 1 - Портал за откриване и достъп до данни

Стадий 1 - Генетични алелни честоти

Стадий 2 - Федериран анализ на данни

flowchart TD
  %% My image with a constrained aspect ratio
  BG@{ img: "figures/flag_bg.png", label: "Биоинформатик", pos: "t", h: 60, constraint: "on" }
  DE@{ img: "figures/flag_de.png", label: "Инфрастуктура в Германия", h: 60, constraint: "on" }
  DK@{ img: "figures/flag_dk.png", label: "Инфрастуктура в Дания", h: 60, constraint: "on" }
  HUB

  BG-.->|Изпращане на задача|HUB

  HUB-.->DE
  HUB-.->DK

  DK-->HUB
  DE-->HUB

  HUB-->|Агрегирани резултати|BG

Потребители

Изследователи
Биоинформатици
Апликационни специалисти
Разработчици на
научен софтуер

Намерете презентацията онлайн

https://gdi-presentation-251208.mmcbg.org/GDI%20Presentation.html